Spring Cloud Hystrix服务容错 您所在的位置:网站首页 hystrix 功能 Spring Cloud Hystrix服务容错

Spring Cloud Hystrix服务容错

2022-12-19 06:49| 来源: 网络整理| 查看: 265

在微服务的架构中,服务间通常会形成相互依赖的关系,比如现在有三个微服务节点:A,B和C,B为A的消费者,C为B的消费者。假如由于网络波动或者A服务自身故障,导致B调用A服务的线程被挂起进入长时间的等待。在高并发的情况下可能导致B的资源被耗竭随之崩溃,从而导致C服务也不可用。这种连环式的雪崩效应在微服务中较为常见,为了解决这个问题,服务熔断技术应运而出。熔断一词来自电路学,指的是电路在出现短路状况时,“断路器”能够及时地切断故障电路,避免电路过载发热引发火灾。

类似的,微服务架构中的断路器能够及时地发现故障服务,并向服务调用方返回错误响应,而不是长时间的等待。Spring Cloud Hystrix在Hystrix(又是一款由Netflix开发的开源软件,Github地址https://github.com/Netflix/Hystrix)的基础上进行了封装,提供了服务熔断,服务降级,线程隔离等功能,通过这些功能可以提供服务的容错率。

使用Hystrix

这里将在上一节Spring Cloud Ribbon客户端负载均衡源码的基础上配置Hystrix。

我们先看下在没有配置Hystrix之前,关闭Eureka-Client是什么效果。

分别使用peer1和peer2配置启动Eureka-Server集群,然后启动两个Eureka-Client实例,端口分别为8082和8083,最后启动Ribbon-Consumer。准备完毕后,我们关闭端口为8082的Eureka-Client,然后发送GET请求http://localhost:9000/user/1,返回结果如下:

下面开始使用使用Spring Cloud Hystrix,在项目Ribbon-Consumer中引入Spring Cloud Hystrix依赖:

在入口类上加入或者注解。这两个注解是等价的,查看注解源码就可以证实这一点:

在引入或者注解后,我们的入口类代码如下:

入口类上总共包含了三个注解、和,这三个注解的组合可以使用来代替,源码如下:

接着将UserController中的方法提取出来,创建一个UserService(为了简单起见,不再创建Service接口):

接着改造UserService的方法:

我们在方法上加入了注解,注解的属性指定了被调用的方法不可用时的回调方法(服务熔断时的回调处理逻辑,即服务降级),这里为方法(必须与方法的参数及返回值类型一致)。

在UserController中调用UserService的方法:

修改完后启动Ribbon-Consumer并重重新启动8082端口的Eureka-Client,发送数次GET请求http://localhost:9000/user/1后,再次关闭8082端口的Eureka-Client。

断开后,继续发送GET请求http://localhost:9000/user/1,当轮询到8082端口时返回数据如下图所示:

可以看到,当轮询到服务不可用时,触发了熔断机制,接口回调了指定的方法。

我们也可以模拟服务超时的情况,可以在Eureka-Client提供的接口方法中设置线程等待,等待时间大于2000(Hystrix默认超时时间为2000 毫秒)即可触发调用方Ribbon-Consumer的服务熔断。

@HystrixCommand详解

注解还包含许多别的属性功能,下面介绍一些常用的属性配置。

服务降级

上面TestController中的中我们用注解指定了服务降级方法。如果方法也抛出异常,那么我们可以再次使用注解指定方法降级的方法,比如定义一个方法:

重启Ribbon-Consumer,并关闭8082端口的Eureka Client服务,访问http://localhost:9000/user/1:

异常处理

在使用注解标注的方法中,除了异常外,别的异常都会触发服务降级。假如我们想指定某个异常不触发服务降级,可以使用注解的属性进行忽略。如:

此外,对于方法抛出的异常信息,我们可以在服务降级的方法中使用对象获取,如:

命名与分组

通过指定注解的、以及属性可以设置命令名称、分组以及线程池划分,如:

上面的配置指定了命令的名称为,组名为,线程池名称为。

通过设置命令组,Hystrix会根据组来组织和统计命令的告警、仪表盘等信息。默认情况下,Hystrix命令通过组名来划分线程池,即组名相同的命令放到同一个线程池里,如果通过设置了线程池名称,则按照线程池名称划分。

当方法被调用时,日志打印如下:

可看到线程名称为getUserThread-1。

Hystrix缓存

我们在Controller中调用三次方法,参数都为1L:

当访问http://localhost:9000/testCache时,控制台输出如下:

开启缓存可以让方法只被调用一次,剩下两次直接从缓存里获取。

开启缓存

要在Hystrix中开启缓存很简单,只需使用注解即可,修改UserService的方法:

通过上面的设定,Hystrix会将返回的User对象进行缓存,缓存的key默认为方法的所有参数,这里只有一个id参数,所以缓存的key为用户id。

这里在测试的时候遇到一个异常:

java.lang.IllegalStateException: Request caching is not available. Maybe you need to initialize the HystrixRequestContext? at com.netflix.hystrix.HystrixRequestCache.get(HystrixRequestCache.java:104) ~[hystrix-core-1.5.12.jar:1.5.12] at com.netflix.hystrix.AbstractCommand$7.call(AbstractCommand.java:478) ~[hystrix-core-1.5.12.jar:1.5.12] at com.netflix.hystrix.AbstractCommand$7.call(AbstractCommand.java:454) ~[hystrix-core-1.5.12.jar:1.5.12] …

在Hystrix的issue中找到了类似的提问:https://github.com/Netflix/Hystrix/issues/1314。

大致意思是在使用Hytrix缓存之前,需要通过初始化Hystrix请求上下文,请求结束之后需要调用方法关闭请求。

所以我们可以定义一个过滤器来实现这个过程:

到这里,我才意识到,其实Hystrix的缓存还是蛮鸡肋的,请求缓存不是只写入一次结果就不再变化的,而是每次请求到达Controller的时候,我们都需要为HystrixRequestContext进行初始化,之前的缓存也就是不存在了,我们是在同一个请求中保证结果相同,同一次请求中的第一次访问后对结果进行缓存,缓存的生命周期只有一次请求!

改造完毕后,重启项目再次访问http://localhost:9000/testCache,控制台输出如下:

设定key值

我们也可以明确的指定缓存的key值是什么。指定key的值有两种方式:

通过注解指定,如:

也可以指定参数对象内部属性为key值:

通过方法来指定,方法的返回值必须是String类型:

值得注意的是,方法2的优先级比方法1高。

缓存清除

在涉及到更新User信息的方法上,我们要及时的清除相应的缓存,否则将会导致缓存数据和实际数据不一致的问题。我们在UserService的方法上做缓存清除操作:

的属性和里定义的一致。

请求合并

请求合并就是将多个单个请求合并成一个请求,去调用服务提供者,从而降低服务提供者负载的,一种应对高并发的解决办法。

Hystrix中提供了一个注解,该注解可以将处于一个很短的时间段(默认10 毫秒)内对同一依赖服务的多个请求进行整合并以批量方式发起请求。为了演示注解的使用方法,我们改造下Eureka-Client(服务提供者)的UserController接口,提供一个批量处理的方法:

然后在Ribbon-Consumer的UserService里添加两个方法:

注解的属性指定了批量处理的方法为下面定义的方法,的值为100(毫秒),意思是在100毫秒这个时间范围内的所有对的调用,都将被合并为一个批量处理操作,进行批量处理操作的方法就是。

我们在TestController中添加一个测试方法:

上面的测试方法中对方法进行了4次的调用,最后一次调用(f4)之前先让线程等待200毫秒(大于中定义的100毫秒),所以我们的预期是前三次调用会被合并,而最后一次调用不会被合并进去。

启动Ribbon-Consumer,访问http://localhost:9000/testRequestMerge,控制台输出如下:

可以看到,控制台的输出符合我们的预期,f1、f2和f3被合并成了一个请求。

而且可以看到,控制台并没有打印出方法中的的日志,实际上方法并不会被调用,所以上面的代码可以简化为:

虽然通过请求的合并可以减轻带宽和服务的压力,但合并请求的过程也会带来额外的开销。就拿上面的来说,比如我们对单个的方法调用耗时5ms,那么调用4次耗时可以粗略的估算为20ms。当我们使用Hystrix的请求合并功能后,前3次请求(f1、f2和f3)进行了合并,第4次请求(f4)没有进行合并,那么耗时可以粗略的估算为(100为上面中指定的时间范围,在该时间段过后,才会调用第4次请求),结果明显比单独调用4次来得高。所以实际中是否该使用Hystrix的请求合并功能,需结合实际需求进行抉择。

Hystrix属性

除了上面涉及到的Hystrix属性配置外,其还包含了大量的别的可用配置。配置可以分为四个级别,优先级从低到高分别为:全局默认配置、全局配置、实例默认值、实例配置。

Commond

execution

: 该属性用来设置执行的隔离策略,它有如下两个选项。

: 通过线程池隔离的策略。它在独立的线程上执行, 并且它的并发限制受线程池中线程数量的限制。

: 通过信号量隔离的策略。它在调用线程上执行, 并且它的并发限制受信号量计数的限制。

实例配置中的HystrixCommandKey对应@HystrixCommand注解中commandKey 属性指定的值。

: 该属性用来配置HystrixCommand执行的超时时间,单位为毫秒。当HystrixCommand执行时间超过该配置值之后, Hystrix会将该执行命令标记为TIMEOUT并进入服务降级处理逻辑。

: 该属性用来配置HystrixCommand的执行是否启用超时时间。默认为true, 如果设置为false, 那么属性的配置将不再起作用。

: 该属性用来配置当HystrixCommand执行超时的时候是否要将它中断。

: 该属性用来配置当HystrixCommand执行被取消的时候是否要将它中断。

: 当HystrixCommand的隔离策略使用信号量的时候,该属性用来配置信号量的大小(并发请求数)。当最大并发请求数达到该设置值时,后续的请求将会被拒绝。

fallback

: 该属性用来设置服务降级策略是否启用,如果设置为false,那么当请求失败或者拒绝发生时,将不会调用降级服务。

circuitBreaker断路器

: 该属性用来确定当服务请求命令失败时, 是否使用断路器来跟踪其健康指标和熔断请求。

: 该属性用来设置在滚动时间窗中,断路器熔断的最小请求数。例如,默认该值为20 的时候,如果滚动时间窗(默认10秒)内仅收到了19个请求, 即使这19个请求都失败了,断路器也不会打开。

: 该属性用来设置当断路器打开之后的休眠时间窗。休眠时间窗结束之后,会将断路器置为“半开” 状态, 尝试熔断的请求命令,如果依然失败就将断路器继续设置为“打开” 状态,如果成功就设置为“关闭” 状态。

: 该属性用来设置断路器打开的错误百分比条件。例如,默认值为5000 的情况下,表示在滚动时间窗中,在请求数量超过阅值的前提下,如果错误请求数的百分比超过50, 就把断路器设置为“打开” 状态, 否则就设置为“关闭” 状态。

: 如果将该属性设置为true, 断路器将强制进入“打开” 状态,它会拒绝所有请求。该属性优先于属性。

: 如果将该属性设置为true, 断路器将强制进入“关闭” 状态, 它会接收所有请求。如果属性为true, 该属性不会生效。

metrics配置

该配置与HystrixCommand执行中捕获的指标信息有关。

: 该属性用来设置滚动时间窗的长度, 单位为毫秒。该时间用于断路器判断健康度时需要收集信息的持续时间。断路器在收集指标信息的时候会根据设置的时间窗长度拆分成多个“桶” 来累计各度量值,每个“桶” 记录了一段时间内的采集指标。例如,当采用默认值10000毫秒时, 断路器默认将其拆分成10个桶(桶的数量也可通过参数设置),每个桶记录1000毫秒内的指标信息。

: 该属性用来设置滚动时间窗统计指标信息时划分“桶” 的数量。

: 该属性用来设置对命令执行的延迟是否使用百分位数来跟踪和计算。如果设置为false,那么所有的概要统计都将返回-1。

: 该属性用来设置百分位统计的滚动窗口的持续时间,单位为毫秒。

: 该属性用来设置百分位统计滚动窗口中使用“桶”的数量。

: 该属性用来设置在执行过程中每个“桶” 中保留的最大执行次数。如果在滚动时间窗内发生超过该设定值的执行次数,就从最初的位置开始重写。例如,将该值设置为100, 滚动窗口为10秒,若在10秒内一个“桶”中发生了500次执行,那么该“桶”中只保留最后的100次执行的统计。另外,增加该值的大小将会增加内存量的消耗,并增加排序百分位数所需的计算时间。

: 该属性用来设置采集影响断路器状态的健康快照(请求的成功、错误百分比)的间隔等待时间。

requestContext

: 此属性用来配置是否开启请求缓存。

collapser

: 该参数用来设置一次请求合并批处理中允许的最大请求数。

: 该参数用来设置批处理过程中每个命令延迟的时间,单位为毫秒。

: 该参数用来设置批处理过程中是否开启请求缓存。

threadPool

: 该参数用来设置执行命令线程池的核心线程数,该值也就是命令执行的最大并发量。

: 该参数用来设置线程池的最大队列大小。当设置为-1时,线程池将使用实现的队列,否则将使用实现的队列。

: 该参数用来为队列设置拒绝阈值。通过该参数,即使队列没有达到最大值也能拒绝请求。该参数主要是对队列的补充, 因为队列不能动态修改它的对象大小,而通过该属性就可以调整拒绝请求的队列大小了。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有